SNOW, un algorithme exploratoire pour le subspace clustering
نویسندگان
چکیده
Résumé. Cet article propose un nouvel algorithme pour le problème de subspace clustering dénommé SNOW. Contrairement aux approches descendantes classiques, il ne repose pas sur l’hypothèse de localité et permet l’affectation d’une donnée à plusieurs clusters dans des sous-espaces différents. Les expérimentations préliminaires montrent que notre approche obtient de meilleurs résultats que l’algorithme COPAC sur une base de référence et a été appliquée sur une base de données réelles.
منابع مشابه
SSC: Statistical Subspace Clustering
Résumé. Cet article se place dans le cadre du subspace clustering, dont la problématique est double : identifier simultanément les clusters et le sousespace spécifique dans lequel chacun est défini, et caractériser chaque cluster par un nombre minimal de dimensions, permettant ainsi une présentation des résultats compréhensible par un expert du domaine d’application. Les méthodes proposées jusq...
متن کاملLogique Floue appliquée à l'inférence du « Risque Inhérent » en audit financier
Résumé : Le Risque d’Audit est un indice d’existence d’erreurs dans les états financiers d’une entreprise. Trois modèles mathématiques sont associés à ce concept du RA : un modèle « Bayesien », un modèle « évidentialiste », et un modèle « flou ». Ces trois modèles accusent des incohérences mathématiques et des difficultés d’application pratique, surtout au niveau de la composante « Risque Inhér...
متن کاملLa carte GHSOM comme alternative à la SOM pour l'analyse exploratoire de données
Résumé. L’objecif de cet article est de faire de la carte auto-organisatrice hiérarchique (GHSOM) un outil utilisable dans le cadre d’une démarche d’analyse exploratoire de données. La visualisation globale est un outil indispensable pour rendre les résultats d’une segmentation intelligibles pour un utilisateur. Nous proposons donc différents outils de visualisation pour la GHSOM équivalents à ...
متن کاملUn algorithme de classification topographique non supervisée à deux niveaux simultanés
Résumé. Une des questions les plus importantes pour la plupart des applications réelles de la classification est de déterminer un nombre approprié de groupes (clusters). Déterminer le nombre optimal de groupes est un problème difficile, puisqu’il n’y a pas de moyen simple pour connaître ce nombre sans connaissance a priori. Dans cet article, nous proposons un nouvel algorithme de classification...
متن کاملARQAT : plateforme exploratoire pour la qualité des règles d'association
Résumé. Le choix de mesures d’intérêt pour la validation des règles d’association constitue un défi important dans le contexte de l’évaluation de la qualité en fouille de données. Mais, comme l’intérêt dépend à la fois de la structure des données et des buts de l’utilisateur (décideur, analyste), certaines mesures peuvent s’avérer pertinentes dans un contexte donné, et ne plus l’être dans un au...
متن کامل